استخراج مولفه های مستقل غیر خطی سیگنال گفتار

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی
  • نویسنده مهدیه قاسمی
  • استاد راهنما علی سیدصالحی
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1384
چکیده

مطالعات بر روی نحوه ادراک گفتار انسان نشان می دهد که مغز انسان به وقایع خاصی در سیگنال گفتار حساسیت بیشتری نشان می دهد و این نواحی حاوی اطلاعات متمایزکننده مفیدی برای واحدهای صوتی پایه است. ماهیت این وقایع بعنوان واحدهای پایه واقعی حاوی اطلاعات غنی و مهم گفتار، از نظر زبان شناسی و مهندسی در دست بررسی است. از سوی دیگر در بررسی جنبه های زیستی ادراک گفتار توسط مغز انسان دیدگاههایی وجود دارد که نشان دهنده آن است که اطلاعات دریافتی مغز، خلاصه شده و چکیده هایی از آن بصورت مولفه های اساسی ادراک به نواحی بالاتر مغز ارسال می شوند و برخی از قوانین محلی آنالیز مولفه های مستقل در تحلیل آنها بکار گرفته می شود. این مطالب موید ایده روش استفاده از مولفه های اساسی و مستقل است که بتواند اطلاعات نواحی پراهمیت سیگنال گفتار را استخراج کند. در این تحقیق بر خلاف سایر روش هایی که بصورت باسرپرستی و بر مبنای دانش افراد خبره مثلاً نواحی گذرا و ایستان و یا وقایع و حالات گفتار را بعنوان نشانه های گفتار در نظر می گیرند، با استفاده از شبکه های عصبی بصورت بدون سرپرستی به شبکه این امکان را می دهیم تا نواحی پراطلاعات سیگنال گفتار را بطور خودکار استخراج کند. پس از استخراج مولفه ها با بهره گیری از راهکارهای مختلف به بررسی ماهیت این مولفه ها می پردازیم تا روشن شود که این مولفه ها بیان کننده چه اطلاعاتی از سیگنال گفتار هستند. ابتدا با کمک روشهای pca آماری ، مولفه های متعامد گفتار و سپس با استفاده از شبکه عصبی جلوسوی سه لایه پنهان با لایه گلوگاه، مولفه های اساسی خطی و غیرخطی در حالت استاتیک (تک فریم در ورودی ) استخراج شده اند. همچنین جهت بررسی مولفه های حالت دینامیک گفتار، استخراج مولفه ها با ورودی 15 فریم نیز انجام شده است.در هر دو حالت استاتیک و دینامیک تعداد واحدهای لایه پنهان متغیر انتخاب شده اند. سپس جهت بررسی ماهیت این مولفه ها و میزان انطباق آنها با واحدهای نشأت گرفته از دانش زبان شناختی نظیر آواها آنالیزهای مختلفی انجام شده و میزان کارآیی مولفه ها بررسی شده است. راهکارهای بکار گرفته در این قسمت عبارتند از : بازسازی پارامترها در خروجی و شنیدن سیگنال گفتار بازسازی شده از آن، محاسبه درصد صحت بازشناسی آوا به ازای تعداد مولفه های مختلف استخراج شده ، رسم فضای پارامترهای بازنمایی ورودی و مانیفولد تصویرشده آن در فضای خروجی، بررسی مقادیر آنالوگ کدهای لایه پنهان و یافتن ارتباط بین مقادیر استخراج شده و مفاهیم آشنای گفتار فارسی. بررسی ها نشان می دهد که در روش pca غیرخطی مولفه اول استخراج شده نشان دهنده ویژگی واکدار یا بی واک بودن گفتار است و مولفه دوم سعی دارد که بین واکه ها تمایز قرار دهد. همچنین بعلت شکل گیری مانیفولد غیرخطی، میزان اطلاعات عبوری به ازای یک نورون در لایه گلوگاه قابل توجه است. در تعلیم شبکه pca غیرخطی مولفه های اساسی غیرخطی به ترتیب بزرگی شکل می گیرند و سبب افت پله ای منحنی خطا می شوند. اگر سیگنال گفتار را ترکیبی از منابع و فاکتورهای مجزا در نظر بگیریم، با استفاده از روشهای استخراج مولفه های مستقل می توانیم به منابع اولیه تولید گفتار دست یابیم و آنها را بعنوان مولفه های پایه گفتار برگزینیم. بدین منظور مولفه های مستقل خطی و غیرخطی گفتار با استفاده از روش های شبکه عصبی استخراج شده اند و در هر مرحله مزایا و مشکلات روشها مورد بررسی قرار گرفته است.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تبدیل گفتار بر پایه تحلیل مولفه های مستقل غیر خطی با به کارگیری گفتارهای همزمان شده

تبدیل گفتار از جمله شاخه های جدید تحقیقات گفتاری است. هدف سامانه های تبدیل گفتار تغییر سیگنال گفتار گوینده ی مرجع است به نحوی که خروجی آن همانند گفتار فرد هدف به نظر برسد. روش-های مختلفی از جمله نگاشت کدبوک ها، روش های آماری و ... در این زمینه ارایه شده است، اما کیفیت صوت تولیدی از این سامانه ها هنوز کاملا مطلوب نیست. در این پروژه برای تبدیل گفتار، سیگنال گفتار یک گوینده (گوینده ی مرجع) به دو د...

15 صفحه اول

حذف خودکار آرتیفکت چشمی از سیگنال های مغزی با استفاده از ویژگی های آماری و زمانی- فرکانسی مولفه های مستقل

مهمترین مشکل در بررسی و پردازش ثبت های الکتروآنسفالوگرام (EEG) حضور انواع سیگنال های ناخواسته (آرتیفکت ها) است که حذف آنها با روش تحلیل مولفه های مستقل از بهترین گزینه های ممکن است. هدف مساله تحلیل مولفه های مستقل جداسازی کور ترکیبی خطی از منابع مستقل است. با اعمال این روش روی سیگنال های مغزی آغشته به آرتیفکت، آرتیفکت ها به صورت مولفه های مستقلی استخراج می شوند. تشخیص خودکار مولفه های مستقل مرب...

متن کامل

تشخیص احساسات از سیگنال های گفتار براساس روش های فیلتر

گفتار ابزار اولیه ارتباط بین انسان‌‌ می‌باشد. با افزایش تراکنش میان انسان و ماشین نیاز به محاوره خودکار این دو و حذف کاربر انسانی مورد توجه قرار گرفته است.هدف از انجام این تحقیق، تعیین یک مجموعه از ویژگی‌های تاثیر گذار در تشخیص احساسات مبتنی بر سیگنال صحبت می‌باشد. در این مقاله، سیستمی طراحی گردید که شامل سه بخش اصلی، استخراج ویژگی، انتخاب ویژگی و طبقه‌بندی می‌باشد. پس از استخراج ویژگی‌های پرکا...

متن کامل

استخراج ویژگی های مقاوم از سیگنال گفتار

در این پایان‎نامه دو روش استخراج ویژگی جدید که برای بازشناسی گفتار مفید است، ارائه شده است. ایده اصلی این پایان‎نامه، ارائه یک ساختار منعطف برای بانک فیلتر می‎باشد که به داده‎های آموزشی وابسته است. درحالی‏که سایر روش‎های استخراج ویژگی نظیر mfcc، ساختار بانک فیلتر ثابت و غیرمنعطفی را ارائه می‎دهند. برای پیاده‎سازی هر دو ایده، ابتدا، تعدادی فیلتر یکسان در نظر گرفته می‏شود. سپس، در روش اول، برمبنا...

تشخیص احساسات از سیگنال های گفتار براساس روش های فیلتر

گفتار ابزار اولیه ارتباط بین انسان‌‌ می‌باشد. با افزایش تراکنش میان انسان و ماشین نیاز به محاوره خودکار این دو و حذف کاربر انسانی مورد توجه قرار گرفته است.هدف از انجام این تحقیق، تعیین یک مجموعه از ویژگی‌های تاثیر گذار در تشخیص احساسات مبتنی بر سیگنال صحبت می‌باشد. در این مقاله، سیستمی طراحی گردید که شامل سه بخش اصلی، استخراج ویژگی، انتخاب ویژگی و طبقه‌بندی می‌باشد. پس از استخراج ویژگی‌های پرکا...

متن کامل

یک مدل غیر خطی جدید بر مبنای شبکه های عصبی برای تولید سیگنال الکتروکاردیوگرام

در سال ها اخیر توجه زیادی به تولید مصنوعی سیگنال های الکتروکاردیوگرام (ECG) به کمک یک مدل ریاضی معطوف گشته است. یکی از کاربردهای یک مدل دینامیکی که بتواند سیگنال های ECG مصنوعی تولید کند، ارزیابی آسان دستگاه های پردازش سیگنال تشخیصی ECG می باشد. به علاوه، می توان چنین مدلی را در فشرده سازی و تله مدیسن نیز به کار برد. هم چنین مناسب است مدل از توانایی لازم برای تولید سیگنال های ECG طبیعی و غیر طب...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023